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基于 改进 残 差 网 络 模 型 的 不 同 部 位 移 牛肉 分 类 识别 方法 
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树 州 动物 疫病 预防 控 


摘 要 : [目的 /意义 ] 为 实现 不 同 部 位 和 改 牛 肉 快速 M 


了 一 种 基于 智能 手机 的 牧牛 肉 部 位 识别 软件 。[ 方 法 ] 首先 对 于 采集 到 的 憾 牛 里 将 、 
数据 集 采 用 数据 增强 的 方式 对 其 进行 扩充 ， 共 得 到 的 特 4 


E 确 识别 ， 本 研究 提出 了 一 种 改进 的 残 差 网 络 模型 ， 并 开发 


ENB. EF. AA et ENR 


肉 部 位 图 像 17,640 张 ; 其 次 ， 采 用 在 原 网 络 模型 残 差 块 


之 后 融入 轻 量 级 卷 积 块 注意 力 模块 (Convolutional Block Attention Module, CBAM), LADNER XDA TAB ALE AR 


关键 细节 特征 的 提取 ; 将 原 模型 最 后 的 全 连接 层 进 行 改 进 ， 以 减少 后 续 网 络 层 的 连接 数 ， 防 止 出 现 过 拟 合 ， 


减少 


识别 图 像 所 需 的 时 间 ; 然后 ， 采 用 不 同 的 学 习 率 、 权 重 衰减 系数 和 优化 器 来 验证 对 网 络 收敛 速度 和 准确 率 的 影响 ; 
最 后 ， 开 发 了 移动 端 App， 将 改进 后 的 模型 部 署 到 移动 端 。 [结果 和 讨论 ] 通过 消融 实验 ， 探 究 出 在 CBAM、 
SENet、NAM、SKNet 四 种 注意 力 机 制 模块 中 ， 改 进 效果 最 好 的 是 CBAM。 将 改进 后 的 ResNet18_CBAM 模型 在 包含 
和 尾 牛 里 疹 、 上 脑 、 腿 子 、 胸 肉 4 种 不 同 尾 牛肉 部 位 的 数据 集 上 进行 了 试验 测试 ， 结 果 表 明 ， 改 进 后 的 残 差 网 络 模 
型 在 测试 集 上 的 识别 准确 率 为 96.31% ， 比 改进 前 的 原 网 络 模型 提高 了 2.88%。 在 手机 端的 实际 场景 测试 中 ， 尾 牛 


ResNet18_CBAM 模型 可 在 实际 应 用 中 识别 不 同 部 位 特 4 


FA 


EX., EMR. ET. WARRI ERT 96.30%, 94.92%., 98.04%, 96.49%. ZARR, BoE AY 


目 具 有 良好 的 结果 。[ 结 论 ] AMIE RMR A DT RE 


牛肉 产业 的 食品 质量 安全 ， 


关键 词 : 图 像 分 类 ; 注意 力 机 制 ; 残 差 网 络 ; 移动 端 应 
中 图 分 类 号 : TP391;TS251.7 
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也 为 青藏 高 原 地 区 的 尾 牛 肉 产 业 智 能 化 发 展 提供 技术 支撑 。 
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15, Ë 


先 牛 肉 素 有 “牛肉 之 冠 ” 的 美和 你， 是 市 场 上 稀 
DRA, ATER IEA A AE A. MRE 
RFR DLA) OF EARE |, 202248, PHARE 
2) 380 773, MEE 48.6 AmE, FEF AEA 
467 亿 元 ”"。 尾 牛肉 贸易 市 场 较 大 ,但 依赖 人 工 进 
行 尾 牛肉 部 位 分 类 成 本 高 、 效 率 低 。 目 前 ， 西 藏 当 
雄 县 、 甘 肃 甘南 州 等 地 都 已 经 在 推动 特 牛 屠宰 机 械 
化 ， 其 中 甘南 州 玛 曲 县 建设 了 全 封闭 屠宰 加 工 流水 


线 ， 中 国 性 牛 屠宰 已 经 越 来 越 机 械 化 、 规 模 化 。 
2023 年， 着 力 推进 牛肉 及 其 产品 分 区 、 分 型 、 分 类 
将 是 加 工业 和 技术 研发 的 主要 方向 >. Ak, R 
一 种 准确 、 快 速 的 箔 牛肉 部 位 识别 方法 不 仅 能 提高 
和 尾 牛 肉 产 业 的 质量 和 安全 水 平 ， 提 高 尾 牛 肉 贸 易 效 
率 ， 降 低 成 本 ， 还 能 为 恬 牛 肉 产 业 向 智能 化 方向 发 
展 提 供 技术 支撑 。 

目前 ， 应 用 于 牛肉 、 猪 肉 、 羊 肉 等 肉 类 检测 的 
主要 技术 有 激光 诱导 击 穿 光谱 (Laser-Induced 
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Breakdown Spectroscopy, LIBS) 技术 、 多 光谱 技 
术 、 红 外 / 近 红 外 技术 等 。 这 些 检测 技术 能 够 达到 
较 高 的 准确 率 ， 但 是 由 于 其 实验 成 本 昂贵 、 实 验 条 
件 苛刻 等 特点 难以 将 其 推广 使 用 ， 大 多 运用 于 实验 
室 研究 。 图 像 识 别 具 有 成 本 低 、 可 移植 性 高 、 操 作 
便利 等 特点 ， 得 到 了 广大 研究 者 的 关注 。 但 是 ,将 
图 像 识别 应 用 于 不 同 部 位 犊 牛肉 的 鉴别 方法 以 及 相 
关 研 究 相 对 较 少 。 

深度 学 习作 为 机 器 学 习 ”* 中 的 热门 领域 ， 
具有 学 习 能 力 强 、 可 迁移 性 高 、 并 行 化 处 理 等 特 
点 ， 近 年 来 发 展 飞速 ， 各 种 网 络 层 出 不 穷 ， 网 络 深 
度 越 来 越 深 ， 网 络 参 数 越 来 越 大 ， 网 络 结构 越 来 越 
复杂 “"。 目 前 深度 学 习 方法 在 农业 领域 已 经 广泛 
地 应 用 于 农作物 病毒 虫害 检测 …”、 生 物 量 识 
BSS SA ee MP?! 等 研究 领域 。 随 着 智 
能 手机 领域 技术 的 飞速 发 展 ， 基 于 移动 端的 牛 羊肉 
制品 检测 研究 逐渐 增多 '“”。 运 用 手机 进行 图 像 采 
集 并 检测 具有 成 本 低 、 操 作 便利 、 适 用 范围 更 大 等 
寺 点 。 但 是 对 模型 有 复杂 度 低 、 参 数量 小 的 要 求 。 

为 避免 天 牛肉 生产 和 销售 过 程 中 出 现 不 同 部 位 
混 潘 、 以 次 充 好 等 情况 ， 开 展 尾 牛肉 部 位 识别 研 
究 ， 有 助 于 提高 尾 牛 肉 行业 的 透明 度 和 可 追溯 性 ， 
保障 食品 安全 。 本 研究 首先 通过 将 卷 积 块 注意 力 模 
块 (Convolutional Block Attention Module, CBAM) 
融入 残 差 网 络 模型 ， 以 提高 模型 的 准确 性 和 性 能 ， 
然后 通过 采取 不 同 的 优化 结构 、 不 同 的 学 习 率 、 权 
重 衰 减 系数 和 优化 带 比 较 其 对 网 络 效 率 的 影响 。 将 
改进 后 的 残 差 网 络 模 型 部 署 到 移动 端 。 通 过 开发 分 
类 识别 手机 App， 利 用 智能 手机 采集 尾 牛 肉 样品 图 
BGP SE UE BU. HEER, FERRE. EAP Hg 
肉 的 实时 识别 ， 具 有 高 便捷 性 以 及 普及 性 。 


2 材料 与 方法 


2.1 数据 获取 


实验 所 需 的 尾 牛 肉 实 验 材料 全 部 来 自 于 青海 省 
西宁 市 牛 羊肉 批发 市 场 ， 于 2023 年 1 月 开始 每 天 到 
尾 牛 肉 摊位 拍摄 由 工人 师 传 分 割 的 尾 牛 里 背 、 犊 牛 
EAB. FEF RET. HEP IARE AS, HARIR, 
包括 晴天 、 阴 天 、 雨 天 等 不 同 天 气 。 拍 摄 设备 为 手 


机 ， 成 像 距 离 为 30~80 cm， 图 像 分 辨 率 像素 为 
3024 X 4032， 图 像 格式 为 *.jpg。 共 采集 原始 图 像 
2000 张 ， 考虑 到 本 研究 模型 的 实际 使 用 环境 ， 选 择 
在 顺 光 、 逆 光 、 不 同 背 景 ， 以 及 每 天 中 的 不 同时 间 
进行 图 像 采 集 如 图 1 所 示 。 为 降低 相似 图 片 对 网 络 
模型 训练 的 影响 ， 使 用 人 工 方式 对 所 采集 到 的 原始 
图 像 进行 筛选 ， 筛 选 后 得 到 和 居 牛 肉 部 位 原始 图 像 
1960 张 。 


(a) 462F BA 


(d) 484-4 A 
图 1 AA FHS RK RE AR 


Fig. 1 Yak meat images from different parts collected using 


(c) FIET 


mobile phones 
2.2 数据 预 处 理 


在 本 研究 中 ， 考 虑 到 自 建 的 尾 牛 肉 样 本 数据 集 
数量 较 少 ， 为 提高 网 络 的 泛 化 能 力 与 分 类 识别 性 
能 ， 采 用 数据 增强 的 方式 扩充 原 数 据 集 。 扩 充 方式 
为 对 原 图 像 进行 水 乎 翻转 、 垂 直 翻 转 、 对 比 度 调 
整 、 饱 和 度 调 整 、 灰 度 调 整 、 随 机 方向 旋转 30?、 
随机 方向 旋转 120?、 随 机 方向 旋转 300° 等 ， 如 图 2 
所 示 。 通 过 8 种 方式 对 原 数 据 集 扩充 后 的 图 像 数 量 
为 原来 的 9 倍 ， 包 括 17,640 张 图 像 。 按 照 4: 1 的 标 
准 划 分 训练 集 与 测试 集 ， 得 到 训练 集 尾 牛肉 样本 图 
像 14,112 张 以 及 测试 集 尾 牛肉 样本 图 像 3528 张 。 


2.3 算法 设计 


2.3.1 KREMWA 
在 深度 学 习 中 为 了 解决 随 着 网 络 层 数 不 断 加 
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(a) 原 图 (b) 水 平 翻转 (Cc) 垂直 翻转 


(d) 随 机 方向 旋转 30°(e) 随 机 方向 旋转 120°(f) 随 机 方向 旋转 300? 


(g) 对 比 度 调整 (h) 饱 和 度 调 整 (让 色调 调整 
图 2 数据 扩充 后 的 箔 牛肉 图 片 示例 


Fig. 2 Example of yak meat images after data augmentation 


深 ， 训 练 集 loss 非 但 不 随 着 降低 ， 反 而 随 着 升 高 而 
出 现 网 络 退 化 现象 。He 等 Jeh TIR N k 
构 。 残 差 网 络 由 一 系列 的 残 差 块 组 成 ， 残 差 块 由 普 
通 卷 积 层 以 及 残 差 映射 组 成 。 由 于 在 残 差 结构 中 引 
和 信 了 直接 映射 ， 从 而 保证 了 第 t+1 层 的 参数 一 定 多 
于 第 ! 层 ， 避 免 了 网 络 结构 在 特征 提取 的 过 程 中 出 
现 信 息 丢 失 的 现象 。 本 研究 选取 ResNetl8 和 
ResNet34 作 为 网 络 原型 ， 其 网 络 结构 如 表 1 所 示 。 


表 1 ResNet18 和 ResNet34 网络 模型 结构 
Table 1 Network model structure of ResNet18 and ResNet34 


ResNet18 ResNet34 
Layer name 
18-layer 34 layer 
3 X 3,64 3 X 3,64 
0 O04) y 7D) SC 
canes | x | 2 [3 x et a 
3 X 3,128 3 X 3,64 
x 004) x 
Conv z l x3 a 2 É x a 4 
3 X 3,256 3 X 3,64 
， x 04) x 
Conya x [3 x i 2 (3 x i $ 
3 X 3,512 3 X 3,64 
， x 707) x 
on = 上 x en 2 x > 3 


2.3.2 ”注意 力 机 制 
TEAR TEA A. HEFER, FEE. HE 
牛 胸 肉 的 分 类 问题 中 ， 主 要 是 根据 不 同 的 脂肪 、 


fii. ROR VETS, FECES. HEFER, FEE 
T. FEE I PS AE PB OP AY XI GR tide, CRT 
要 网 络 模型 提取 脂肪 、 筋 、 膜 等 有 用 的 信息 从 而 来 
提高 网 络 模型 的 精度 。 针 对 此 问题 ， 本 研究 提出 在 
ResNet18 中 融入 注意 力 机 制 。 

CBAM 由 通道 注意 力 机 制 (Channel Attention 
Module，CAM) 与 空间 注意 力 机 制 (Spatial Atten- 
tion Module, SAM) 组 成 ， 如 图 3 所 示 。 首 先 ， 对 
输入 大 小 为 所 XHXC (W HEURTE, HI EURE 
高 ，C 为 图 像 的 通道 数 ) 的 特 牛 肉 特征 图 进行 通道 
注意 力 机 制 模 块 处 理 生成 通道 注意 力 特征 图 ， 之 后 
将 原 输入 特征 图 与 通道 注意 力 特 征 图 相 乘 后 生成 新 
的 特征 图 ; 再 将 新 特征 网 进行 空间 注意 力 机 制 模块 
处 理 生 成 空间 注意 力 特征 图 ， 新 特征 图 与 空间 注意 
力 特 征 图 相 乘 ， 得 到 最 后 的 输出 特征 图 。 通 道 注意 
力 机 制 如 图 4 所 示 ， 空 间 注意 力 机 制 如 图 5 所 示 。 


Channel Spatial & 
Attention Attention 
Module Module 


ww 


图 3 CBAM 模型 结构 图 


Input Feature f 


\ Output Feature 


Fig. 3 Model structure of convolutional block attention module 


omit 
eal Ye 


WXH'XC' WXHXC c 


注 : 下 为 传统 的 普通 卷 积 结构 ;X 为 F 的 输入 ;O 为 F 的 输出 ;WH、C 
分 别 为 图 像 的 宽 、 高 .通道 数 ;a 为 经 过 Channel Attention 压缩 之 后 的 
特征 图 ;F 为 将 所 得 权重 与 原 特 征 图 相 夹 ;X' 为 经 过 F 的 最 终 输 出 ; 
W'、H'C' 分 别 为 普通 卷 积 结 构 之 前 原始 输入 图 像 的 宽 、 高 .通道 数 。 
下 同 

图 4 通道 注意 力 机 制 结构 


Fig.4 Structure of channel attention mechanism 


WXH'XC' WXHXC © 
注 :b 为 经 过 Spatial Attention 压缩 之 后 的 特征 图 
图 5 空间 注意 力 机 制 结构 


Fig. 5 Structure of spatial attention mechanism 
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2.3.3 改进 ResNet18 的 竺 牛 肉 部 位 识别 模型 
首先 将 ResNet18、ResNet34 原 始 模 型 在 本 研究 
中 的 数据 集 上 进行 训练 ， 其 结果 如 图 6 所 示 。 


100 


一 一 ResNeti4 
—— ResNetls 


Wa 50 150 200 


100 
迭代 次 数 
图 6 ResNet18 与 ResNet34 模 型 在 测试 集 的 准确 率 变化 曲线 

Fig. 6 The accuracy variation curves of the ResNet18 and 


ResNet34 models in the test set 


HEGRA, AS ORISA EAE BB ar ald KNR 
测试 集 在 ResNet18 上 的 准确 率 高 于 ResNet34 H. 
ResNet18 的 准确 率 变 化 曲线 也 比 ResNet34 fa xe , 
所 以 本 研究 选取 ResNet18 模 型 作为 主干 网 络 进行 
改进 。 

此 外 ， 本 研究 将 CBAM 模块 加 入 ResNet18 网 
络 中 与 单独 将 空间 以 及 通道 注意 力 机 制 加 入 网 络 中 
进行 对 比 ， 其 热力 图 如 图 7 所 示 ， 由 此 可 知 ， 将 
CBAM 模 块 加 入 ResNet18 中 对 本 研究 有 效 。 


(a)ResNet18+CA 
图 7 不 同 注意 力 机 制 在 将 牛肉 数据 集 上 的 热力 图 


(b)ResNet18+SA 


Fig. 7 Heat maps of different attention mechanisms on the data- 


set of yak meat 


改进 后 的 ResNetl8 CBAM 网 络 模 型 结构 如 
图 8 所 示 。 本 研究 提出 改进 的 ResNet18 网 络 主要 有 
两 个 改进 之 处 。 第 一 ， 在 原来 ResNet18 网 络 模 型 的 
每 个 残 差 块 之 后 都 加 上 了 CBAM 模 块 ， 在 网 络 模型 
中 引入 这 一 机 制 可 以 以 较 小 的 计算 开销 和 参数 量 取 


(c)ResNet18+CBAM 


得 较 大 的 精度 提升 。 第 二 ， 将 原 模 型 在 所 有 残 差 块 
之 后 直接 加 上 全 连接 层 改 成 了 先进 行 全 局 平均 池 化 
与 全 局 最 大 池 化 后 再 加 上 全 连接 层 ， 可 以 提高 网 络 
模型 的 准确 率 ， 防 止 出 现 过 拟 合 现象 ， 以 及 减少 后 
续 网 络 层 的 连接 数 ， 加 快 网 络 模型 的 执行 速度 ， 减 
少 手机 端 识 别 图 像 时 的 运算 时 间 。 
2.3.4 评测 指标 

在 本 研究 中 采用 准确 率 (Accuracy，%) 来 作 
为 不 同 部 位 酝 牛 肉 识别 模型 的 评价 指标 ， 通 过 混淆 
和 矩阵 来 分 析 四 种 不 同 部 位 的 尾 牛 肉 的 分 类 情况 。 准 
确 率 为 分 类 正确 的 样本 数 与 实验 中 样本 总 数 的 比 
值 ， 其 计算 如 公式 (1) 所 示 。 


4 7 TP + TN 
ccuracy = TP + TN + FP + EN 


其 中 ，TP、FP、FN、TN 分 别 为 混淆 和 矩阵 中 分 
类 模型 对 不 同 部 位 牧牛 肉 的 分 类 情况 统计 。TP 为 
预测 为 真实 际 为 真 的 样本 个 数 ， 个 ; FP 为 预测 为 
真实 际 为 假 的 样本 个 数 ， 个 ; FN 为 预测 为 假 实际 
为 真 的 样本 个 数 ， 个 ; TN 为 预测 为 假 实 际 为 假 的 
样本 个 数 ， 个 。 


2.4 软件 实现 


为 在 移动 端 实 现 不 同 部 位 犊 牛肉 快 速 、 准 确 识 
别 ， 采 用 PyTorch 深度 学 习 框 架 中 的 PyTorch Mo- 
bile 模块 将 训练 好 的 ResNetl8 CBAM 网 络 模型 转 
换 成 TorchScript 模 型 ， 并 保存 为 *.pt 格 式 。 然 后 使 
用 Android Studio 开发 环境 开发 犀牛 肉 部 位 识别 
App， 包 括 前 端 界面 和 后 端 处 理 两 部 分 。App 前 端 
采用 *.xml 进 行 各 种 按钮 、 文 本 框 的 布局 ， 后 端 采 
用 Java 语言 开发 。 最 后 ， 调 用 *.ptl 格 式 的 Torch- 
Script 模型 实现 尾 牛 肉 的 部 位 识别 功能 。 其 识别 界 
面 如 图 9 所 示 。 


3 实验 及 结果 分 析 


x 100% (1) 


3.1 实验 环境 


本 研究 中 的 网 络 模型 是 在 Windows11 系统 下 进 
行 的 ， 深 度 学 习 框 架 为 基于 Python3.9 的 Pytorch 深 
度 学 习 框架 ; CPU 为 AMD R9 5900HX (16 G), 
GPU 为 Nvidia GeForce RTX 3080。 使 用 Cuda 进行 
加 速 训练 ， 实 验 环 境 为 Anaconda3+PyCharm。 
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一 一 一 一 一 一 一 一 一 一 一 一 , Residual CBAM Residual CBAM 
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Conv(3 X3) Conv(3x3) CBAM(Convolutional Block Attention Module) 


laxPool(2X2) \ _ _ = = 


a 


Conv(3 X3) re 
224X224X64 


2X 112 128 


FEEN 
> 一 一 LogSoftMax 分 类 层 
CRT 
512 
FEFK 


1024 


注 : APA A IRCA ARME H ,其 大 小 为 一 个 224X224X3 的 三 通道 图 像 ;Residual CBAM 表 示 在 每 一 个 残 差 块 后 面 加 入 CBAM 模块 
后 形成 的 新 的 模块 ;BN-ReLU 表 示 在 特征 图 经 过 批量 归 一 化 之 后 采用 ReLU 激 活 函 数 进行 激活 六 四 "表示 两 个 特征 图 相 乘 六 四 "表示 两 个 特征 


图 相 加 


图 8 ResNetl8 CBAM 网 络 模型 的 结构 示意 图 


Fig. 8 The structural diagram of the ResNetl8 CBAM network model 


SHSKAR. £R ASR#NA 


图 9 基于 ResNet18 CBAM 网 络 模型 开发 的 App 464 A 
部 位 识别 展示 图 
Fig. 9 Display diagram for identifying yak meat parts based on 


the developed ResNet18 CBAM network model 
3.2 训练 策略 


为 使 改进 后 的 ResNet18 CBAM 网 络 模型 达到 
更 好 的 训练 效果 ， 采 用 以 下 的 训练 策略 ， 如 表 2 
所 示 。 
3.2.1 优化 器 

在 深度 学 习 的 模型 训练 过 程 中 优化 器 的 选择 对 


表 2 ResNet18_CBAM 模型 实验 训练 策略 
Table2 Experimental training strategy of ResNet18_CBAM 


model 


训练 策略 方法 


优化 器 随机 梯度 下 降 算 法 (Stochastic Gradient Descent) 


损失 函数 26 SLi tit pK ( Cross Entropy Loss) 
学 习 率 调节 余弦 退火 算法 (Cosin Annealing LR) 


模型 的 准确 率 有 着 重大 的 影响 。 目 前 ， 常 用 的 优化 
髓 包括 SGD (Stochastic Gradient Descent ) 、 标 准 动 
量 优化 算法 (Momentum), RMSProp 算法 、Adam 
算法 等 。 本 研究 选择 了 SGD Ej Adam 优化 器 ， 在 训 
练 集 上 的 准确 率 表现 如 图 10 所 示 。 由 图 10 可 知 ， 
相对 于 SGD 优 化 器 而 言 ， 使 用 Adam 优化 器 时 ， 模 
型 的 准确 率 在 整个 过 程 中 波动 都 比较 大 ， 且 使 用 
SGD 优化 器 时 模型 的 准确 率 明 显 高 于 Adam 优化 
器 ， 因 此 选择 SGD 优化 器 。 
3.2.2 ”损失 函数 

EPEC ML Nitin A PKA (Cross Entropy Loss) 作 
为 改进 ResNet18 CBAM 网 络 模型 的 损失 函数 。 交 
又 炉 作为 信息 论 中 的 一 个 重要 的 概念 ， 它 在 机 器 学 
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HEN% 


— Adam,tr-0.01 

一 一 Adam.ir=0.001 
— SGD,Ir-0.001 4-0 
— SG6DJlr01a0.0001 


209 TO 20 30 40 30 
FEAR 
A 10 基于 ResNet18 CBAM 模型 在 不 同 模 型 参数 下 测试 集 
准确 率 变化 曲线 


Fig. 10 Accuracy variation curves of test set based on 


ResNetl8 CBAM model under different model parameters 


习 中 表现 为 真实 概率 分 布 与 预测 概率 分 布 之 间 的 差 
异 。 在 深度 学 习 中 表现 为 网 络 模 型 训练 时 梯度 越 
大 ， 网 络 模 型 的 优化 速度 更 快 。 该 损失 函数 的 表达 
式 如 公式 (2) 所 示 。 


1 15“ 
Loss = HL- -y D 2e log (Pe) (2) 


FE, Loss #e an tit K KZG N 表 示 样 本 数 ， 
个 ; M 表 示 类 别 数 ， 个 ; p 表 示 观 测 的 第 i 个 样本 
属于 第 c 个 类 别 的 概率 分 布 值 ; 六 表示 真实 第 ;个 样 
本 属于 第 c 个 类 别 的 概率 分 布 值 ， 若 属于 类 别 c， 
则 取 1; £p FI], WKO. 

3.2.3 ”学 习 率 调节 

选用 余弦 退火 算法 (CosinAnnealingLR) 作为 

网 络 模型 ResNet18 CBAM 的 学 习 率 衰减 算法 。 


3.3 ResNet18_CBAM 模型 的 超 参 数 优 化 


3.3.1 学 习 率 选择 
在 本 研究 所 选取 的 优化 器 SGD 中 ， 当 学 习 率 


的 学 习 率 分 别 为 0.1、0.01、0.001、0.0001 和 
0.00001 来 比较 网 络 模型 的 训练 效果 。 学 习 率 调节 
对 网 络 模 型 训练 损失 的 影响 如 图 11 所 示 。 


2.0 

FAF 
— Ql 
— 00) 
— 0.001 
— 6.0001 
0.00001 


0.0 10 20 30 A 


损失 值 


YA 


ay Vy 
ue 10 TE. 
过 代 次 数 


LA / VA A 
0 40 50 
(b) 微 调 学 习 率 
图 11 基于 ResNet18_CBAM 模 型 在 不 同学 习 率 下 测试 集 损 
失 值 变化 曲线 
Fig. 11 Loss value change curve of test set under different 
learning rate based on ResNet18 CBAM model 
由 图 11 (a) 可 知 ， 当 网 络 模型 的 学 习 率 值 为 
0.1 与 0.01 时 ,训练 的 损失 值 变化 平稳 ,但 是 损失 
值 下 降 速度 极其 缓慢 ; 当 学 习 率 值 为 0.001 时 ， 模 
型 收敛 速度 最 快 ， 效 果 最 好 ; 当 学 习 率 值 为 0.0001 


设置 过 小 时 ， 网 络 模 型 训练 的 收敛 速度 比较 慢 ， 训 
练 成 本 比较 大 ; 当 学 习 率 设置 过 大 时 ， 容 易 导 致 损 
失 函 数 错过 最 优 解 ， 网 络 模 型 不 收敛 。 为 了 选择 合 
适 的 学 习 率 ， 本 研究 通过 采用 粗 调 学 习 率 与 微调 学 
习 率 两 种 方式 来 观察 不 同学 习 率 下 网 络 模型 的 损失 
曲线 的 变化 情况 来 确定 一 个 使 ResNetl8_CBAM 网 
络 模型 收敛 效果 较 好 的 学 习 率 。 在 PyTorch 深度 学 
习 框架 中 ，SGD 优化 器 的 默认 参数 中 ， 学 习 率 的 值 
为 0.001， 所 以 在 本 研究 中 进行 学 习 率 粗 调 时 选取 


时 ,虽然 也 有 一 定 的 收敛 效果 ， 但 是 效果 远 不 如 学 
习 率 为 0.001 的 时 候 ; 当 学 习 率 为 0.00001 时 ， 模 型 
收敛 效果 最 差 。 

由 于 当 学 习 率 值 为 0.001 时 模型 收敛 效果 最 好 ， 
所 以 以 0.001 为 基础 进行 微调 ,设置 的 学 习 率 的 值 
分 别 为 0.001、0.002、0.003、0.004 和 0.005， 观 察 
模型 的 训练 损失 值 变 化 。 由 图 11 (b) 可 知 ， 当 学 
习 率 的 值 为 0.003 时 ,模型 收敛 效果 最 好 ， 虽然 没 
有 以 最 快速 度 达 到 最 低 损 失 值 ， 但 是 稳定 之 后 模型 
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的 损失 值 曲线 无 太 大 波动 。 因 此 ， 对 于 本 研究 中 的 
网 络 模型 ， 选 择 学 习 率 为 0.003。 
3.3.2 HAMMETT 

在 神经 网 络 模型 的 训练 过 程 中 ， 批 大 小 的 选择 
也 是 影响 神经 网 络 模型 的 一 个 因素 ， 在 前 面 确定 了 
学 习 率 为 0.003 之 后 ， 开 始 考虑 不 同 批 大 小 对 网 络 
模型 性 能 的 影响 ， 本 研究 中 选择 的 批 大 小 分 别 为 8、 
16、32、64， 不 同 批 大 小 对 训练 损失 与 测试 集 准确 
率 的 影响 如 图 12 所 示 。 


损失 值 


4 bd Como ISA AN NANOS 
10 20 30 40 50 
选 代 次 数 


(a) 不 同 批 下 的 损失 


250. 10 20 30 40 50 
选 代 次 数 
(b) 不 同 批 下 的 准确 率 
图 12 基于 ResNet18 CBAM 模型 在 不 同 批 大 小 下 测试 集 损 
失 值 和 准确 率 变化 曲线 


Fig. 12 Loss value and accuracy change curves of test set based 


on ResNetl8 CBAM model under different batch sizes 


由 图 12 (a) 可 知 ， 当 批 大 小 为 8、16、64 时 ， 
损失 值 波动 较 大 ， 且 收敛 速度 较 慢 ; 当 批 大 小 为 32 
时 ,损失 值 波 动 小 ， 收 敛 速度 快 。 由 图 12 (b) 可 
知 ， 当 批 大 小 为 32 时 模型 收敛 速度 虽然 不 是 最 快 ， 
但 是 准确 率 曲线 后 期 波动 最 小 ， 且 准确 率 最 高 ， 所 
以 本 研究 选择 批 的 大 小 为 32。 


3.4 结果 分 析 


3.4.1 改进 ResNet18_CBAM 模型 的 消融 实验 

本 研究 提出 的 改进 ResNet18 CBAM 模型 ， 包 
含 两 个 改进 ， 分 别 是 : (1) 将 CBAM 模 块 融 入 主干 
网 络 的 每 一 个 残 差 块 后 面 ; (2) 在 整个 网 络 模型 最 
后 加 上 两 层 池 化 层 。 为 了 验证 本 研究 改进 模型 的 有 
效 性 ， 进 行 了 两 个 改进 之 处 的 消融 实验 ，ResNet18+ 
池 化 网 络 模型 得 出 的 准确 率 为 93.88%，ResNel8 _ 
CBAM 网 络 模型 得 出 的 准确 率 为 96.31%， 且 使 用 
ResNet18+ 池 化 网 络 模型 进行 训练 时 所 使 用 的 平均 
检测 时 间 与 训练 时 间 少 于 ResNet18 网 络 模型 。 因 为 
池 化 层 可 以 减少 特征 图 的 大 小 ， 从 而 也 减少 了 后 续 
网 络 的 计算 量 ， 同 时 保留 重要 的 特征 信息 ， 所 以 在 
主干 网 络 中 加 入 两 层 池 化 层 可 以 提高 准确 率 以 及 缩 
短 检测 时 间 和 训练 时 间 。 而 由 于 CBAM 模 块 能 够 对 
通道 和 空间 信息 进行 自 适 应 的 加 权 处 理 ， 从 而 强化 
了 特征 图 中 重要 通道 和 空间 的 位 置 ， 可 以 更 好 地 捕 
提 图 像 中 的 重要 特征 ， 所 以 在 加 入 池 化 层 的 基础 上 
再 融入 CBAM 模 块 能 有 效 提高 模型 的 准确 率 。 
3.4.2 不 同 注意 力 机 制 模块 对 比 

将 本 研究 所 采用 的 CBAM 注意 力 机 制 模块 融入 
ResNet18 网 络 中 与 SENet、NAM 以 及 SKNet 3 种 注 
意 力 机 制 模块 融入 ResNet18 网 络 中 进行 对 比 实验 ， 
其 结果 如 表 3 所 示 。 
表 3 基于 不 同 注意 力 机 制 模块 下 测试 集 准确 率 的 实验 结果 


Table 3 Test set accuracies based on different attention 


mechanism modules 


ResNet18+ ResNetl8+ ResNetl8+  ResNet18+ 
CBAM SENet NAM SKNet 


模型 


准确 率 /% 96.31 94.12 92.51 93.85 


由 表 3 可知 ， 使 用 CBAM 模 块 融入 ResNet18 网 
络 中 的 准确 率 为 96.31%，SENet 模 块 的 准确 率 为 
94.12%, NAM 模块 的 准确 率 为 92.51%，SKNet 模 
块 的 准确 率 为 93.85%， 使 用 CBAM 模块 时 的 准确 
率 都 高 于 其 他 3 种 模块 。 由 此 可 知 ， 在 本 研究 中 使 
用 CBAM 模 块 改进 ResNet18 是 必要 上 且 优越 的 。 
3.4.3 不 同 网 络 模 型 性 能 对 比 

迁移 学 习 技 术 已 广泛 应 用 于 深层 网 络 模型 的 设 
计 和 参数 训练 ， 使 用 迁移 学 习 可 以 缩减 模型 的 训练 
过 程 ， 提 高 模型 的 泛 化 能 力 ， 减少 过 拟 合 的 风险 ， 
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同时 也 降低 对 数据 集 规模 要 求 。 因 此 ， 本 研究 中 所 
有 的 神经 网 络 模 型 均 采 用 迁移 学 习 的 方式 进行 训 
练 。 采 用 数据 集 InageNet 对 模型 进行 预 训练 获得 各 
层 的 参数 ， 然 后 将 本 研究 中 的 尾 牛 肉 部 位 图 像 数 据 
集 输 入 预 训练 模型 进行 训练 ， 微 调 神经 网 络 模型 的 
最 后 一 层 。 将 本 研究 中 的 ResNet18 CBAM 模型 与 
AlexNet、VGG11、ResNet34、ResNetl8 这 4 种 经 
典 日 参数 量 不 过 大 的 图 像 分 类 模型 进行 对 比 ， 其 识 
别 结果 如 表 4 所 示 。 
表 4 不 同 模 型 的 和 尾 牛肉 部 位 识别 结果 对 比 


Table 4 Recognition results comparison of yak meat part using 


different models 


平均 检测 ”训练 时 


模型 名 称 浮 点 运算 量 准确 率 /% 、 、 
时 间 /s 间 /s 
AlexNet 0.71 X 10° 92.16 0.1052 77.87 
VGGI1 11.21X 10° 93.12 0.9551 286.62 
ResNet34 3.67 X 10° 93.38 0.2262 136.82 
ResNet18 1.82X 10° 93.43 0.1886 102.04 


ResNet18 CBAM 1.83 X10? 96.31 0.2014 112.66 


从 表 4 可 知 : 中 相 比 于 VGG11 45 ResNet34 模 
型 ， 改 进 的 ResNet18 CBAM 模 型 无 论 是 从 准确 率 
还 是 检测 时 间 上 更 优 。 在 模型 的 训练 时 间 上 ， 
ResNetl18 CBAM It VGG11, ResNet34 分 别 少 用 
173.96、24.16 s; 在 模型 的 平均 检测 时 间 上 ， 比 
VGG11, ResNet34 4} il) tk > 0.7537, 0.0248 s; 在 
模型 的 准确 率 上 ， 比 VGG11、ResNet34 分 别提 升 
3.19%、2.93%。 但 是 VGG11 与 ResNet34 网络 模型 
的 译 点 运算 量 都 比较 大 ， 网 络 模型 结构 更 为 复杂 ， 
因此 本 研究 中 ResNet18 CBAM 网 络 模 型 准确 率 均 
高 于 且 平 均 训 练 时 间 均 低 于 VGG11 与 ResNet34 网 
络 模型 。@ 相 比 于 浮 点 运算 量 较 小 的 网 络 模型 
AlexNet, ResNet18_CBAM 在 先 牛肉 部 位 识别 的 准 
确 率 上 提升 4.15%， 有 较为 明显 的 优势 。@ 相 比 于 
经 典 的 ResNet18 网 络 模型 原型 ，ResNet18_CBAM 
在 平均 检测 时 间 与 平均 训练 时 间 上 分 别 增加 了 
0.0128 和 10.62 s， 但 是 ResNet18 CBAM 在 准确 率 
上 比 经 典 的 ResNet18 网 络 模型 提高 了 2.88%。 

本 研究 中 各 个 网 络 模型 的 准确 率 与 迭代 轮 数 如 
图 13 所 示 。 

由 图 13 可 知 ，VGG11 网络 模型 在 前 期 表现 最 
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图 13 基于 不 同 模 型 下 测试 集 准确 率 的 变化 曲线 
Fig. 13 Change curves of test set accuracy based on different 
models 
好 ， 明 显 优 于 其 他 四 个 模型 ， 虽 然 在 后 期 也 达到 了 
稳定 ， 但 是 准确 率 低 于 ResNet18 CBAM 网 络 模型 。 
ResNet18 49 ResNet34 网 络 模型 效果 相近 ， 前 后 期 
准确 率 曲 线 波 动 较 大 ， 但 ResNetl8 稍 优 于 
ResNet34 网 络 模型 ， AlexNet 网络 模型 表现 效果 最 
差 ， 全 程 准 确 率 曲 线 波 动 较 大 ， 且 准确 率 明 显 低 于 

其 他 三 个 模型 。 
3.4.4 ResNet18_CBAM 网 络 模型 在 实际 测试 中 
的 表现 

为 了 验证 本 研究 算法 的 可 靠 性 ， 到 西宁 市 牛 羊 
肉 批发 市 场 对 开发 的 App 进行 实际 场景 测试 ， 其 部 
分 测试 图 片 如 图 14 所 示 。 其 测试 结果 汇总 如 表 5 
所 示 。 

FEAR URUK PURE FEA, E. BS Hg 
肉 样本 分 别 为 54、59、51、57 份 ， 计 算 其 平均 识 
sEm, APERE KET 96.30%, HEFER 
达到 了 94.92%, FEAF ETXE] T 98.04%, FE Ji 
肉 达 到 了 96.49%。 从 测试 结果 来 看 ， 该 网 络 模型 在 
实际 场景 测试 中 有 着 可 靠 的 表现 。 


4 结论 


针对 竺 牛肉 部 位 识别 问题 ， 本 人 研究 以 ResNet18 
神经 网 络 模型 为 原型 ， 将 CBAM 模块 融入 到 
ResNet18 网 络 模型 每 一 个 残 差 块 的 后 面 ， 提 出 了 一 
种 改进 的 网 络 模 型 ResNet18 CBAM。CBAM 模块 
从 通道 与 空间 两 个 维度 增强 了 注意 力 机 制 对 模型 的 
提升 效果 ， 能 够 在 较 小 的 开销 下 实现 较 大 的 性 能 改 
进 。 并 将 原 ResNet18 网 络 模型 的 最 后 一 层 全 连接 层 
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(ase Opi (OPET (A) HEE 
A 14 基于 ResNet18 CBAM 网 络 模型 开发 的 App 先 牛肉 部 
识别 实际 测试 结果 


Fig. 14 Actual test results of yak meat part recognition using 
App developed based on ResNetl8 CBAM network model 
#5 HF ResNet18_CBAM 网 络 模 型 开发 的 App 竺 牛肉 部 
位 识别 实际 测试 结果 汇总 


Table 5 Actual test results for yak meat part recognition using 


the App developed based on ResNet18 CBAM network model 


部 位 名 称 ”样本 数 /个 正确 样本 数 /个 错误 样本 数 / 个 准确 率 /% 


Hy 54 52 2 96.30 
上 脑 59 56 3 94.92 
HEF 51 50 1 98.04 
胸 肉 57 55 2 96.49 


sels nn ea 
减少 后 续 网 络 的 计算 量 。 得 到 以 下 结论 : 
We 
后 面 融 入 CBAM 模 块 可 以 有 效 提取 脂肪 、 筋 、 腊 等 
有 用 的 信息 从 而 来 提高 网 络 模 型 的 精度 。 
(2) 改进 后 的 ResNet18 模型 对 4 种 不 同 部 位 


和 尾 和 牛肉 识别 准确 率 达 到 了 96.31%， 在 准确 率 上 超过 
了 AlexNet、VGG11、ResNet34、 ResNet18 四 种 
网 络 模型 。 


(3) 将 改进 后 的 ResNet18 CBAM 模 型 与 手机 
应 用 相 结 合 ， 开 发 了 不 同 部 位 先 牛 肉 识别 移动 端 
App， 为 尾 牛 肉 产 业 往 智 能 化 方向 发 展 提 供 了 技术 
SHE. SEM, HEERA EMRK 96.30%, HE 
Æ E Ai ME Wf K A 94.92%, FE AR EME he RO 
98.04%, HEA ji AME Wh RA 96.49%, A RRR 
别 效果 。 
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研究 成 果 有 关 的 利益 冲突 。 
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Abstract: 

[Objective] Conducting research on the recognition of yak meat parts can help avoid confusion and substandard parts during the pro- 
duction and sales of yak meat, improve the transparency and traceability of the yak meat industry, and ensure food safety. To achieve 
fast and accurate recognition of different parts of yak meat, this study proposed an improved residual network model and developed a 
smartphone based yak meat part recognition software. 

[Methods] Firstly, the original data set of 1960 yak tenderloin, high rib, shank and brisket were expanded by 8 different data enhance- 
ment methods, including horizontal flip, vertical flip, random direction rotation 30°, random direction rotation 120°, random direction 
rotation 300°, contrast adjustment, saturation adjustment and hue adjustment. After expansion, 17,640 yak meat images of different 
parts were obtained. The expanded yak meat images of different parts were divided according to the 4:1 ratio, resulting in 14,112 yak 
meat sample images in the training set and 3528 yak meat sample images in the test set. Secondly, the convolutional block attention 
module (CBAM) was integrated into each residual block of the original network model to enhance the extraction of key detail features 
of yak images in different parts. At the same time, introducing this mechanism into the network model could achieve greater accuracy 
improvement with less computational overhead and fewer parameters. In addition, in the original network model, the full connection 
layer was directly added after all residual blocks instead of global average pooling and global maximum pooling, which could im- 
prove the accuracy of the network model, prevent overfitting, reduce the number of connections in subsequent network layers, acceler- 
ate the execution speed of the network model, and reduce the computing time when the mobile phone recognized images. Thirdly, dif- 
ferent learning rates, weight attenuation coefficients and optimizers were used to verify the influence of the improved 
ResNet18_CBAM network model on convergence speed and accuracy. According to the experiments, the stochastic gradient descent 
(SGD) algorithm was adopted as the optimizer, and when the learning rate was 0.001 and the weight attenuation coefficient was 0, the 
improved ReaNetl8 CBAM network model had the fastest convergence speed and the highest recognition accuracy on different parts 
of yak data sets. Finally, the PyTorch Mobile module in PyTorch deep learning framework was used to convert the trained 
ResNet18 CBAM network model into TorchScript model and saved it in *.ptl. Then, the yak part recognition App was developed us- 
ing the Android Studio development environment, which included two parts: Front-end interface and back-end processing. The front- 
end of the App uses *.xml for a variety of price control layout, and the back-end used Java language development. Then TorchScript 
model in *.ptl was used to identify different parts of yak meat. 

[Results and Discussions] In this study, CBAM, SENet NAM and SKNet, four popular attentional mechanism modules, were inte- 
grated into the original ResNet18 network model and compared by ablation experiments. Their recognition accuracy on different parts 
of yak meat dataset were 96.31%, 94.12%, 92.51% and 93.85%, respectively. The results showed that among CBAM, SENet, NAM 
and SKNet, the recognition accuracy of ResNet18 CBAM network model was significantly higher than that of the other three attention 
mechanism modules. Therefore, the CBAM attention mechanism module was chosen as the improvement module of the original net- 
work model. The accuracy of the improved ResNetl8 CBAM network model in the test set of 4 different parts of yak tenderloin, high 
rib, shank and brisket was 96.31%, which was 2.88% higher than the original network model. The recognition accuracy of the im- 
proved ResNet18 CBAM network model was compared with AlexNet, VGG11, ResNet34 and ResNet18 network models on different 
parts of yak test set. The improved ResNetl8 CBAM network model had the highest accuracy. In order to verify the actual results of 
the improved ResNet18 CBAM network model on mobile phones, the test conducted in Xining beef and mutton wholesale market. In 
the actual scenario testing on the mobile end, a total of 54, 59, 51, and 57 yak tenderloin, high rib, shank and brisket samples were col- 
lected, respectively. The number of correctly identified samples and the number of incorrectly identified samples were counted respec- 
tively. Finally, the recognition accuracy of tenderloin, high rib, shank and brisket of yak reached 96.30%, 94.92%, 98.04% and 
96.49%, respectively. The results showed that the improved ResNetl8 CBAM network model could be used in practical applications 
for identifying different parts of yak meat and has achieved good results. 

[Conclusions] The research results can help ensure the food quality and safety of the yak industry, improve the quality and safety lev- 
el of the yak industry, improve the yak trade efficiency, reduce the cost, and provide technical support for the intelligent development 


of the yak industry in the Qinghai-Tibet Plateau region. 


Key words: image classification; attention mechanism; residual network; mobile applications; recognition of yak meat parts; transfer 
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